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摘要 : [目的 /意义 ] 社 交 媒 体 是 网 络 信 息 资 源 的 重要 组 成 部 分 ,对 国内 外 社交 媒体 存档 的 相关 研究 成 果 进 
行 总 结 与 梳理 ,形成 比较 完整 的 综述 内 容 , 为 国内 该 领域 研究 提供 参考 与 借鉴 。 [ 方法“ 过程] 基于 多 学 科 视 角 ， 
通过 文献 计量 与 内 容 分 析 得 到 社交 媒体 存档 领域 的 文献 分 布 情况 ,总 结社 交 媒 体 存档 的 理论 基础 ,从 宏观 层面 
将 社交 媒体 存档 理论 与 实践 研究 归纳 为 “目的 与 主体 “政策 与 指南 "”“ 问 题 与 障碍 "三 个 研究 主题 并 展开 综 
述 。[ 结果 /结论 ] 国内 外 社交 媒体 存档 研究 具有 发 展 速 度 较 快 .与 实践 结合 紧密 、 区 域 发 展 不 均衡 等 特征 ,在 未 
来 研究 中 需要 重视 研究 对 象 的 变化 、 管 理 标准 的 构建 以 及 多 主体 间 的 协作 。 最 后 对 国内 社交 媒体 存档 研究 与 


实践 的 发 展 提出 建议 。 

D 关键 词 : 社交 媒体 ”网络 信息 资源 
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网 络 存档 ”数据 管 护 长 期 保存 


如 今 ,社交 媒体 信息 的 长 期 保存 成 为 了 网 络 信息 
次 涯 存档 研究 领域 中 的 重要 内 容 。2010 年 ,美国 国会 
ARB (LOC) 宣布 与 Twitter 合作 ,将 美国 境内 IP 发 布 
的 铸 有 推 文子 以 存档 上 ,这 一 极 具 代 表 性 的 事件 有 效 
推动 了 欧美 发 达 国家 社交 媒体 存档 的 实践 与 研究 工 
WOE 12 月 ,美国 国家 档案 与 文件 署 (NARA ) 发 布 
TGuidance on Managing Records in Web 2. 0/Social 
Media. Platforms ,成 为 了 最 先 颁布 社交 媒体 数据 管理 
政策 的 官方 机 构 。2013 年 ,美国 国家 数字 管理 联盟 对 
美国 网 络 信息 资源 存档 状况 进行 了 调查 ,发 现 受 访 者 
最 为 关注 的 存档 内 容 即 是 社交 媒体 数据 "。 在 近年 的 
iSchool 联盟 年 会 iConference 和 美国 档案 工作 者 协会 年 
会 上 ,也 均 有 学 者 提 到 了 社交 媒体 存档 的 问题 及 相关 
的 技术 方案 。 目 前 ,来 自 图 书 情报 学 .档案 学 .计算 
机 科学 与 社会 学 等 学 科 的 学 者 均 从 特定 视角 出 发 对 社 
交 媒 体 存档 进行 了 讨论 ,涉及 了 社交 媒体 存档 的 理论 
基础 .应 用 价值 .问题 障碍 .实现 技术 等 多 方面 的 课题 ， 
使 得 社交 媒体 存档 这 一 交叉 领域 的 研究 更 具 层 次 和 深 
度 。 


目前 ,国内 外 关于 网 络 信息 存档 的 综述 性 文章 屡 
见 不 鲜 ,但 尚未 发 现 有 学 者 对 社交 媒体 存档 的 研究 成 
果 进 行 比较 全 面 的 梳理 和 总 结 , 现 存 的 少数 研究 也 存 
在 学 科 视 时 单一、 内容 片 面 的 现象 。 本 文 基于 多 学 科 
视角 对 近 十 年 以 来 社交 媒体 存档 领域 的 研究 成 果 进行 
较为 系统 的 介绍 与 评述 , 理 清 相关 研究 的 主流 方向 与 
脉络 ,以 期 为 社交 媒体 存档 的 相关 研究 提供 参考 。 


2.1 文献 的 时 间 分 布 
本 研究 主要 利用 了 Web of Science, EBSCO LIS- 
TA, EI Compendex 等 外 文 数据 库 以 及 CNKI 万 方 等 中 
文 数据 库 ,经 过 检索 、. 过滤 得 到 相关 英文 文献 225 篇 ， 
中 文 文献 128 篇 。 对 所 得 中 英文 文献 进行 历时 分 析 ， 
得 出 的 国内 外 相关 研究 成 果 发 表 的 时 间 分 布 情况 见 图 
1。 结 果 显 示 , 国 内 外 学 界 对 社交 媒体 存档 主题 进行 研 
究 均 始 于 2000 年 以 后 。IBM 实验 室 的 工 . Raymond 于 
2001 年 在 ACM 承办 的 数字 图 书馆 国际 会 议 上 发 表 了 
有 关 早 期 博客 长 期 保存 问题 的 文章 ” ,是 最 早 涉足 这 
领域 的 学 者 之 一 。 而 在 中 文 文献 方面 ,2006 年 吴 开 
平 在 其 硕士 论文 中 提 到 了 对 博客 等 新 型 网 络 信息 资源 


* 本 文系 国家 社会 科学 基金 项 目 " 社 交 媒 体 文 件 的 归档 与 管理 标准 体系 研究 ”( 项 目 编号 :16BTQ093 ) 研究 成 果 之 一 。 
作者 简介 : 黄 新 荣 (ORCID :0000 -0003 -3881 -8492 ) ,公共 信息 资源 管理 系 主任 ,副教授 ,博士 ,E-mail:;huangxr@nwu. edu. en; 3 & £8 ( OR- 


CID :0000 — 0002 -6446 -5822 ) ,硕士 研究 生 。 
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进行 保存 的 必要 性 和 策略 ,开启 了 国内 相关 研究 的 
序幕 。 

1 反映 出 了 中 文 文献 数量 在 时 间 分 布 态势 和 特 
征 上 与 英文 文献 之 间 的 相似 性 ,两 者 开始 平稳 增长 的 


累 还 比较 有 限 ,社交 媒体 存档 仍 是 一 个 具备 潜力 有待 
开拓 的 新 领域 。 
2.2 关键 词 共 现 分 析 

同一 领域 内 高 频 关 键 词 的 共 现 关系 能 够 反映 出 特 


起 点 与 峰值 均 存 在 约 6 年 的 时 间 差 。 结 合 特定 的 时 间 
背景 不 难 理解 这 一 现象 产生 的 原因 ,2004 年 Facebook 
成 立 ,带动 了 欧美 国家 社交 媒体 行业 的 发 展 ;而 2010 
年 是 中 国 的 “ 微 博 元 年 ” ,国内 新 浪 、 腾 讯 .网 易 等 互联 
网 巨头 都 增设 了 微 博 服务 ,用 户 数量 大 幅 增 加 ,社交 媒 
体 在 社会 大 众 信 息 生 活 中 占有 很 高 的 比重 。 整 体 而 
言 ,这 一 人 研究 方向 中 的 文献 数量 ,尤其 是 国内 文献 的 积 


.00583v1 


一 0 一 英文 文献 数量 (篇 ) 


1 国内 外 社交 媒体 存档 研究 相关 文献 的 时 间 分 布 


一 e 一 中 文 文献 数量 (篇 ) 


Website access control 


202307 


eTwitter (Web resource) 
一 -个 


QStudents Records management 


Teaching 
Theory of knowledge 
N v 
2 Virtual rea 


lity 
ON T 
" Data acquisition 
Storage Se 
Three dimensional Semantic Web 


User interfaces 


chinaXiv 


Water resources 


Space stations White noise 
v ę ISE 


Time series analysis : di 
€ (echnical presentation.. 


Three dimensional computer dio 


Vocabulary control 


Standards 

Data mining au 

š ” @Web development 
ias A 


Web crawler 


Neb databases 
: 


2 bTweny /^ Tinno of archivists 


Electronic records management 


定 领域 内 重要 的 研究 主题 。 由 图 2 可 见 ,英文 文献 中 
HJ" Social media” “ Digital preservation ”及 “Web Ar- 
chive "是 出 现 频率 最 高 . 共 现 关系 最 复杂 的 关键 词 ,后 
两 者 有 效 界 定 了 社交 媒体 存档 所 属 的 上 位 研究 领域 。 
观察 上 述 核心 词汇 的 共 现 关键 词 ,不 难得 出 与 载 文 分 
布 中 的 相似 结论 一 一 计算 机 科学 在 社交 媒体 存档 研究 
中 扮演 重要 角色 ,“ Data mining" "Semantie Web” 
“Computer graphics” 等 也 是 计算 机 和 互联 网 科学 中 的 
研究 热点 。 数 据 挖掘 和 语义 网 技术 对 社交 媒体 存档 中 
的 信息 组 织 与 知识 发 现 具有 重要 作用 ,计算 机 图 形 学 
和 自然 语言 处 理 则 被 用 于 多 种 社交 媒体 数据 类 型 的 识 
别 与 分 析 , 这 些 词汇 的 多 次 共 现 也 体现 了 信息 管理 类 
科学 与 计算 机 科学 在 研究 领域 与 技术 方法 上 的 交叉 融 
f ,社交 媒体 存档 需要 交叉 学 科研 究 以 搭建 起 立体 化 、 
层次 化 的 理论 研究 与 实践 工作 体系 。 
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图 2 英文 文献 高 频 关键 词 共 现 关系 


相 比 于 英文 文献 ,中 文 文献 高 频 关键 词 共 现 网 络 
的 封闭 性 更 为 显著 ,同时 体现 出 词性 和 词义 的 集聚 现 
象 。 如 "社交 媒体 " 与 “社交 媒体 信息 ”“ 社 交 媒 体 文 
件 ”“ 社 交 媒 体 档案 ”等 名 词性 专业 词汇 以 及 “保存 ” 
“归档 ”“ 存 档 ”“ 长 期 存 取 ”等 动词 性 的 专业 词汇 均 为 
高 频 关 键 词 。 结 合 词汇 的 期 刊 与 作者 来 源 , 不 难 发 现 
这 些 词汇 的 选取 与 学 者 的 专业 背景 紧密 相关 ,档案 学 


E 


学 者 更 倾向 于 选取 “社交 媒体 档案 *" “归档 ” ,而 图 书 
情报 学 学 者 往往 会 选择 “社交 媒体 信息 ”及 “保存 ” 
“ 存 取 ”等 词汇 。 男 一 方面 ,图 3 中 出 现 的 大 多 为 外 延 
广泛 的 宏观 词汇 ,尚未 发 现 具体 层面 的 策略 性 与 技术 
性 词汇 ,这 也 从 侧面 反映 出 目前 国内 社交 媒体 存档 研 
究 的 广 深度 还 比较 有 限 ,与 计算 机 互联 网 等 技术 科学 
的 融合 程度 有 待 提升 。 
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“网 络 信息 归档 


国家 档案 局 


3 ”中 文 文献 高 频 关键 词 共 现 关系 


“社交 媒体 存档 ”的 理论 基础 
XB “社交 媒体 存档 "的 释义 与 界定 


加 ”社交 媒体 存档 ”概念 由 社交 媒体 ( Social media) 
FEES (Archiving) 组 合 而 成 。Archiving 一 词 在 Web 
Aive 的 相关 研究 中 被 赋予 了 多 种 定义 ,这 些 定义 依 
其 内 涵 可 以 划分 为 两 类 "1 :一 类 基于 档案 学 视角 ,将 
ASiving 翻译 为 "归档 ”, 与 此 对 应 的 行为 是 主体 将 具 
存 交 期 保存 价值 的 网 络 信息 资源 通过 相应 的 技术 手段 
保存 在 可 控 的 存储 介质 中 ,注重 资源 的 控制 权 和 资源 
本 于 的 档案 特性 ; 另 一 类 基于 信息 管理 视角 ,将 Ar 
ching 理解 为 “存档 " “存档 ”不仅 包括 “归档 ”过程 中 
的 < 采集 ”与 “保存 "环节 ,通常 还 包括 资源 的 描述 .分 
析 $ 挖 据 与 开发 等 后 续 的 信息 组 织 与 整理 环节 ,词义 及 
其 对 应 的 活动 内 容 更 为 丰富 。 本 文 倾向 于 将 Archiving 
理解 为 “存档 ” ,认为 “存档 "所 体现 出 的 非 线性 管理 思 
维和 方式 适应 了 社交 媒体 信息 的 保存 与 开发 ,同时 也 
与 大 数据 时 代用 户 的 信息 需求 相 契 合 。 

对 “社交 媒体 "概念 的 理解 直接 决定 社交 媒体 存 
档 的 基本 对 象 和 范围 。 社 交 媒 体 通常 指 “ 一 组 基于 
Web 2.0 思维 和 技术 , 允许 并 鼓励 用 户 生 成 内 容 
(UGC) 的 创作 及 交换 的 互联 网 应 用 程序 ”" ,其 主要 
特征 包括 以 下 四 个 方面 :基于 Web 2.0 模式 .以 用 户 生 
成 内 容 为 核心 .个体 或 组 织 生成 内 容 的 设计 与 维护 由 
社交 媒体 服务 商 负责 .通过 建立 用 户 之 间 的 社交 关系 
来 促进 社交 媒体 发 展 ”"。 结 合 以 上 定义 , Facebook , 
Twitter „Instagram , YouTube 等 英文 社交 媒体 以 及 以 新 
浪 微 博 、 腾 讯 微 信 为 代表 的 中 文 社交 媒体 是 社交 媒体 
存档 最 主要 的 研究 与 工作 对 象 ,目前 国内 外 社交 媒体 
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存档 研究 基本 也 是 围绕 上 述 几 个 平台 
展开 。 
3.2 社交 媒体 存档 的 相关 理论 

社交 媒体 存档 以 社交 媒体 内 容 为 


m 基本 对 象 , 而 每 一 具体 对 象 都 具备 特 
定 的 来 源 和 主体 ,两 者 均 是 完整 的 社 
交 媒 体 信息 的 重要 组 分 。 相 应 地 ,与 
社交 媒体 存档 相关 的 理论 研究 同时 涉 
及 到 主体 及 信息 内 容 两 部 分 ,学 者 们 
既 关 注 社交 媒体 信息 内 容 作 为 社会 记 
忆 数字 资产 的 基本 价值 ,也 注重 社交 
媒体 存档 中 信息 用 户 的 观念 和 诉求 。 
笔者 对 社交 媒体 存档 的 相关 理论 及 代 
表 性 观点 进行 了 整合 ,结果 见 表 1。 


4 社交 媒体 存档 的 目的 与 主体 


昌 户 主体 在 社会 生活 中 拥有 不 同 层次 及 方向 的 信 
息 需 求 ,这 决定 了 社交 媒体 存档 活动 也 将 基于 不 同 的 
目的 。 对 于 社交 媒体 存档 ,其 宏观 目的 主要 包括 科学 
研究 、 网 络 信 息 资 源 保存 和 司法 活动 。 相 应 地 ,社交 媒 
体 存档 的 价值 表现 形式 由 其 目的 决定 。 
4.1 科研 数据 的 保管 与 共享 
社交 媒体 平台 被 学 者 认为 是 科研 活动 中 的 重要 数 

据 源 ,是 科研 数据 获取 与 共享 的 关键 渠道 ,对 社交 媒体 
数据 进行 规范 的 存档 与 管理 是 社交 媒体 数据 共享 的 先 
决 条 件 ”。 目 前 国内 外 在 社交 媒体 科研 数据 的 存档 
与 共享 方面 尚 不 存在 明确 的 行为 规范 与 指导 方案 , 现 
有 的 社交 媒体 研究 数据 存档 与 共享 均 为 非 正式 行为 。 
4.1.1 学 者 团队 主导 的 社交 媒体 科研 数据 存档 ”以 
M. Cha 为 主导 的 学 者 团队 在 进行 Twitter 的 网 络 生态 
研究 时 采集 并 存档 了 一 个 由 17 亿 条 推 特 组 成 的 特定 
数据 集 ” ,重点 保存 其 中 涉及 的 用 户 入 度 、 推 文 转发 
和 提 及 数据 ,以 关注 Twitter 用 户 的 影响 力 。 该 学 者 团 
队 在 取得 Twitter 官方 许可 的 前 提 下 ,借助 其 自 编 的 仆 
虫 程序 通过 Twitter 官方 API 对 5 200 万 名 用 户 的 Twit- 
ter 链接 关系 及 推广 内容 进行 采集 ,最 终 过 滤 得 到 并 保 
存 了 618 万 活路 用户 及 其 Twitter 数据 内 容 作 为 研究 材 
料 , 并 通过 其 项 目 官方 网 站 “http://tinyud. com/” 提 供 
相关 Twitter 数据 共享 ,由 于 该 研究 目的 在 于 识别 Twitter 
用 户 的 网 络 影响 力 , 因 此 在 Twitter 数据 存档 时 主要 以 体 
现 用 户 间 关 系 的 “用 户 域 "为 数据 组 织 单位 ,应 Twitter 
官方 的 要 求 ,该 团队 目前 只 提供 特定 Twitter 数据 集 匿名 
状态 下 的 拓扑 关系 ,不 提供 具体 的 用 户 及 其 推 文 数据 。 
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表 1 社交 媒体 存档 的 相关 理论 概述 
主要 理论 作用 类 型 /作用 方式 主要 观点 文献 来 源 
社会 记忆 理论 基础 价值 QD 集体 记忆 建构 于 个 体 记忆 之 上 ,对 个 体 的 思维 和 行为 习惯 产生 影响 Mgl], M. Halbwachsl!!], P. Con- 
正 向 支持 加 社交 媒体 是 社会 记忆 建构 过 程 中 的 原始 材料 和 资源 nerton[12] Library of Congress[13] , F. 
加 社交 媒体 以 催化 型 方式 介入 社会 记忆 的 维系 ,有 利于 推动 权力 架构 趋 。 Susharndjant 等 (14]， 孙 洋洋 5] 
向 平衡 
数字 文化 基础 /应 用 价值 (DTwitter „Instagram 等 社交 媒体 是 历史 记录 的 一 部 分 ,具备 数字 文化 遗 。 C. Tiffany[4] Library of Congress[13] ， 
遗产 理论 正 向 支持 产 容 器 功能 ,数字 遗产 的 保存 与 维系 提供 了 潜在 支持 C. F. Tsail!6], J. Bentel 7], T. Consiglio 
@“ 非 正式 "的 社交 媒体 信息 在 一 定 程度 上 记录 了 一 段 历史 时 期 内 的 社 sl, 徐 宽 等 [19] 
会 状态 ,具有 作为 数字 资源 的 保存 价值 
信息 隐私 理论 应 用 价值 人 社交 媒体 平台 直接 关联 用 户 个 人 ,涉及 用 户 隐私 信息 , 易 被 第 三 方 机 B. France 等 [2]，R. Chakraborty 
负 向 作用 为 主 Fail JH #121] H. K. Malema 等 [22] B. Xu 
@ 需 要 法 律 法 规 对 社交 媒体 存档 的 基本 目的 和 行为 子 以 规范 等 [3] ,万 凯 莉 等 024] , 涂 海 丽 等 [25] 
@ 图 书馆 档案 馆 应 介入 社交 媒体 存档 工作 中 来 ,对 社交 媒体 信息 进行 
统一 保存 与 管理 
日 本 东北 大 学 的 M. Tatsubori ^" 团队 将 与 2011 年 。 于 地 理 位 置 等 多 样 化 的 数据 检索 方式 ,用 户 可 通过 其 
胸骨 本 大 地 震 相 关 的 社交 媒体 数据 予以 统一 存档 , 认 ”主页 链接 到 相关 数据 集 的 GitHub 页 面 或 直接 在 主页 


为 弦 些 数据 是 灾害 管理 和 应 急 管理 研究 中 的 重要 科研 
本 业 , 同 时 设计 了 社交 媒体 科研 数据 存档 的 系统 。 该 
又 缠 主 要 包括 “档案 类 数据 应 用 ”、 “外 部 机 构 合 作 ”、 
“ 短 第 主 平台 "以 及 “公众 数据 获取 ”四 个 模块 ,支持 其 
他 和 群 研 机 构 大 规模 的 科学 数据 共享 请 求 ,政府 .企业 、 
BOULE RE 通 民众 也 可 通过 API 获取 经 平台 处 理 过 
的 加 视 化 数据 ,其 系统 架 & 构 体现 出 简洁 实用 的 特征 。 
ie 科研 机 构 主 导 的 社交 媒体 科研 数据 存档 “在 
各 机 构 方面 ,由 德国 科 布 伦 芯 一 一 兰 道 大 学 (Univer- 
sity'ó f Koblenz-Landau ) 网 络 科技 研究 所 主持 的 网 资 
BP H KoNECT( Koblenz Network Collection ) ? 
合 嘱 保存 了 上 百 种 不 同类 型 的 社交 网 络 关系 数据 集 ， 
该 研究 所 的 科研 人 员 将 这 些 数据 集 依 特定 的 网 络 类 型 
委 构 属性 进行 分 为 23 个 大 类 ,并 对 不 同 的 数据 集 进 
行 详 略 有 别 的 描述 与 组 织 ,其 形式 包括 元 数据 描述 、 社 
交 关 系 方向 描述 ,关系 权重 描述 .关系 等 级 描述 以 及 添 
加 时 间 戳 . 非 完 整数 据 集 标注 等 ,同时 绘制 出 每 一 数据 
集 的 网 络 结构 特征 图 ,如 累积 度 分 布 图 、. 聚 类 系数 分 布 
图 等 。 该 项 目 通 过 其 主页 将 社交 媒体 数据 集 向 公众 开 
放 , 在 对 数据 集 进行 充分 描述 的 基础 上 还 提供 原始 数 
据 的 下 载 链接 ,以 供 其 他 学 者 进行 二 次 分 析 , 具 有 较 强 
的 开放 性 。 

瑞士 洛桑 联邦 理工 学 院 支 持 的 CrisisLex ”项 目 则 
侧重 于 对 用 户 发 布 内 容 的 收集 ,该 项 目 采集 并 保存 了 
与 社会 危机 事件 相关 的 社交 媒体 数据 并 制作 了 危机 数 
据 词 典 。 该 数据 集 在 数据 的 组 织 与 描述 上 采用 众 包 形 
式 ,参与 者 按照 项 目 负责 人 提供 的 标签 类 型 ,依据 不 同 
数据 集 的 主题 特征 对 数据 集 进行 标注 。 在 数据 利用 和 
共享 方面 ,CrisisLex 支持 基于 关键 词 .基于 Hashtag | d£ 


上 下 载 CSV 格式 的 原始 数据 。 

整体 而 言 , 以 上 两 类 主体 主持 的 社交 媒体 科研 数 
据 存档 ,其 实践 案例 目前 还 比较 少见 ,在 数据 的 保存 与 
共享 方面 仍然 受到 社交 媒体 服务 商 的 政策 制约 。 相 比 
之 下 , 仅 由 学 者 团队 负责 的 社交 媒体 科研 数据 存档 与 
机 构 负 责 的 项 目 制 下 的 社交 媒体 科研 数据 存档 在 保存 
数据 的 体 量 数据 整理 的 能 力 \ 存 档 流程 的 规范 性 、 存 
档 数据 的 开放 性 以 及 共享 数据 类 型 的 多 样 性 上 还 存在 
较 大 差距 ,但 以 上 两 种 社交 媒体 科研 数据 存档 活动 能 
够 促进 其 他 科研 团体 认识 到 社交 媒体 数据 的 保存 与 管 
理 之 于 科研 工作 的 重要 性 。 科 研 团体 主导 的 社交 媒体 
科研 数据 存档 依赖 于 具体 的 科研 项 目 与 学 者 团队 , 相 


关 主 体能 否 长 期 持续 地 对 社交 媒体 科研 数据 进行 存 
Fi 整理 并 免费 向 其 他 学 者 提供 利用 将 决定 这 一 模式 
的 发 展 潜力 。 

4.2 网 络 信息 资源 保存 


以 网 络 信息 资源 保存 为 目的 的 社交 媒体 存档 ,其 
目标 与 价值 因 存 档 主 体 及 主体 认 知 的 不 同 而 产生 了 层 
次 性 的 差异 ,具体 表现 为 个 人 社交 媒体 数据 存档 政务 
社交 媒体 存档 与 区 域 社交 媒体 信息 资源 存档 三 种 类 
型 。 

4.2.1 个 人 社交 媒体 数据 存档 ”社交 媒体 是 个 人 表 

意见 及 显示 社会 身份 的 渠道 ” , 它 能 够 有 效 记录 个 
人 日 常 工作 .生活 中 的 重要 事件 ; 另 一 方面 ,个 人 社交 
媒体 数据 也 是 整个 国家 和 社会 信息 资源 的 重要 组 分 。 
基于 以 上 两 种 认 知 ,可 以 将 个 人 社交 媒体 数据 存档 的 
研究 视 域 分 为 微观 层面 的 个 人 视角 '” 和 宏观 层面 的 
社会 视角 ,不 同 视角 下 个 人 社交 媒体 数据 价值 的 实现 
方式 也 有 所 不 同 。 
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微观 视角 下 的 个 人 社交 媒体 数据 存档 侧重 于 存档 
技术 与 信息 系统 研究 ,以 便 个 人 在 其 自身 产生 的 零散 
无 序 的 社交 媒体 数据 集中 找到 所 需 的 数据 凭证 或 信息 
片段 。Z. Chen 等 ”探讨 了 基于 区 块 链 技 术 ( Block- 
chain) 的 个 人 数据 存档 服务 系统 , 现 已 支持 Facebook、 
LinkedIn 等 平台 上 的 个 人 社交 媒体 数据 存档 。 该 系统 
基于 分 布 式 的 对 等 网 络 , 通 过 生物 特性 识别 .个 人 数字 


二 价值 ”, 即 在 公开 环境 下 对 其 他 社会 成 员 力 至 整个 社 
会 的 价值 。 在 目前 的 法 律 与 道德 环境 下 ,将 个 人 作为 
存档 主体 更 符合 用 户 对 社交 媒体 存档 的 基本 认 知 与 需 
求 ,而 机 构 对 个 人 产生 的 社交 媒体 数据 进行 存档 则 需 
要 在 政策 法 规 行为 指南 、 技 术 标 准 等 方面 进行 更 为 细 
致 的 界定 ,使 其 务必 在 合法 合 规 的 既定 框架 下 进行 。 

4.2.2 政务 社交 媒体 存档 ”在 英美 等 发 达 国 家 , 政 


组 件 (PDA) 等 模块 对 个 人 社交 媒体 数据 内 容 的 真实 性 
予以 认证 ,其 中 个 人 数字 组 件 模块 包括 了 对 已 签名 数 
字 资 源 进 行 描述 的 核心 元 数据 方案 ,该 系统 的 核心 目 
的 在 于 最 大 限度 维护 数字 环境 下 个 人 社交 媒体 数据 
(尤其 是 反映 个 人 成 就 和 验证 个 人 身份 的 数据 ) 的 真 
实 性 和 完整 性 ,以 保障 其 凭证 价值 。D，Vianna ”等 提 
册 的 个 人 数字 存档 工具 “DigitalSelf" 以 社交 媒体 数据 、 
电学 邮件 和 多 媒体 数据 为 主要 存档 对 象 ,能 够 对 用 户 
:组 的 Facebook , Twitter , LinkedIn 等 社交 媒体 内 容 进 
与 保存 。 该 系统 主要 由 社交 媒体 采集 工具 ,个 
cH Ut HR E 社交 媒体 数据 知识 发 现 以 及 社交 
媒体 数据 检索 四 个 模块 ,由 采集 工具 通过 各 大 社交 媒 
HIR REREPEN API 获取 社交 媒体 数据 ,并 保存 至 社 
交 媒 体 数据 库 , 用 户 通过 DigitalSelf 提供 的 检索 工具 可 
对 ZB 人 社交 媒体 原始 数据 进行 检索 ,也 可 调用 知识 发 
更 嵌 块 对 个 人 数据 进行 进一步 处 理 后 再 行 检索 。 整 体 
而 过 ,DigitalSelf 是 一 个 较为 完整 的 个 人 社交 媒体 数据 
(PERIERE 

它 固 于 个 人 隐私 保护 需求 和 各 国信 息 政策 法 规 , 机 
构 作 为 主体 对 个 人 社交 媒体 数据 进行 存档 的 实践 活动 


i an 


gh IL, H Rp DOS Ed Ed x Ee B È hg“ Twitter 存档 项 
目 " 是 完整 且 持 续 的 个 人 社交 媒体 存档 项 目 , 以 “收集 
美国 故事 并 获得 具有 研究 价值 的 数字 资源 "为 目 
的 。 整 体 而 言 ,机 构 存档 个 人 社交 媒体 仍 处 于 理论 探 
讨 阶段 , 邱 扬 凡 -认为 个 人 或 社会 组 织 产生 的 非 政务 
性 微 博 具有 信息 价值 .凭证 参考 价值 以 及 突 发 事件 中 
的 社会 价值 ,综合 档案 馆 目 前 有 能 力也 有 义务 对 这 类 
微 博 进 行 接收 。 万 凯 莉 等 "在 界定 “社交 媒体 用 户 信 
息 ” 与 “社交 媒体 个 人 隐私 "概念 的 基础 上 ,认为 社交 
媒体 服务 商 是 一 个 采集 存档 个 人 社交 媒体 数据 的 可 行 
机 构 , 另 外 图 书馆 和 档案 馆 作为 社会 记忆 的 保存 机 构 
也 应 肩负 起 存档 个 人 社交 媒体 数据 的 责任 。 

对 比 二 者 可 以 发 现 ,微观 视角 侧重 于 个 人 社交 媒 
体 数据 的 “第 一 价值 ” , 即 对 数据 生产 者 、 形 成 者 的 基 
本 价值 ,同时 加 入 了 更 多 个 人 信息 隐私 .数据 保护 方面 
的 考量 。 而 宏观 视角 侧重 于 个 人 社交 媒体 数据 的 “第 
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府 、 国 家 级 档案 部 门 以 及 行业 协会 等 管理 组 织 已 经 明 
确 要 求 业内 单位 应 保存 政务 社交 媒体 ”。 以 存档 主 
体 作 为 划分 标准 ,学 者 对 现 有 的 政务 社交 媒体 存档 模 
式 进行 了 分 类 ,笔者 分 别 将 其 命名 为 “ 双 主 体 模 式 ” 和 
“三 主体 模式 ”。 

“ 双 主 体 模式 "下 的 政务 社交 媒体 存档 主体 包括 
政府 机 构 和 记忆 机 构 两 部 分 。 目 前 ,美国 和 澳 大 利 
亚 的 中 央 政 府 直属 机 构 均 以 职能 部 门 为 主体 对 政务 社 
交 媒 体 进行 存档 ,而 国家 图 书馆 档案 馆 等 主要 起 政策 
制定 与 业务 指导 作用 ,具体 实施 方案 由 各 职能 部 门 自 
行 决定 。 以 NARA 制定 的 政务 社交 媒体 管理 政策 为 指 
导 ,如 海岸 警卫 队 、 住 房 与 城市 发 展 部 、 环 境 保护 局 
等 ”美国 政府 机 构 都 以 自身 职能 为 基础 自行 制定 了 
政务 社交 媒体 管理 政策 ,其 内 容 涉 及 了 政务 社交 媒体 
的 采集 \ 保 存 、 组 织 、 删 除 等 多 项 活动 。 澳 大 利 亚 的 政 
务 社交 媒体 存档 模式 与 美国 类 似 , 依 托 其 国内 成 熟 的 
网 络 存档 项 目 PANDORA ,澳大利亚 国家 图 书馆 对 中 央 
政府 政务 社交 媒体 存档 的 策略 与 方法 进行 统一 规范 ， 
并 由 国家 图 书馆 的 内 设 机 构 指导 政府 各 部 门 职 员 的 政 
务 社交 媒体 管理 行为 ” ,并 提出 了 “社交 媒体 内 容 
否 包含 该 机 构 政 策 、 业 务 与 职责 的 证 据 ? 这 些 信 息 
否 只 存在 于 社交 媒体 平台 ?” 等 问题 辅助 政府 职员 
判断 特定 政务 社交 媒体 内 容 存档 的 必要 性 。 

另外 ,记忆 机 构 因 其 职能 要 求 ,也 参与 到 政务 社交 
媒体 存档 的 工作 中 。 在 这 方面 ,英国 的 政务 社交 媒体 
存档 工作 具有 代表 性 。 英 国 国家 档案 馆 全 权 负 责 中 央 
政府 的 政务 社交 媒体 存档 工作 “” ,其 工作 范围 仅 限 于 
内 阁 直 属 的 各 职能 部 门 ,而 存档 对 象 则 集中 在 Twitter 
和 YouTube 两 个 政府 机 构 常 用 的 社交 媒体 平台 。 目 
前 ,受到 英国 的 网 络 版 权 法 案 与 其 自身 政策 的 严格 限 
定 , 英 国 国家 档案 馆 仅 对 英国 内 阁 直 属 机 构 .2012 伦 
敦 奥运 会 及 残 奥 会 官方 平台 发 布 的 推 文 及 相关 的 
YouTube 视频 进行 统一 存档 ,政府 部 门 利 用 Twitter 转 
发 与 评论 的 数据 内 容 、 非 政府 部 门 社交 媒体 内 容 及 超 
出 网 域 的 政务 社交 媒体 内 容 均 不 在 存档 之 列 。 

“三 主体 模式 ”是 在 “ 双 主 体 模 式 ” 的 基础 上 ,加 入 
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了 第 三 方 机 构 作为 政务 社交 媒体 的 存档 主体 *!。 第 
三 方 机 构 作为 独立 的 商业 公司 和 团队 ,在 技术 水 平 . 职 
能 分 配 .关系 协调 等 方面 具有 优势 ,能 够 更 快 地 对 市 场 
需求 及 用 户 意 愿 做 出 回应 。 如 美国 社交 媒体 数据 管理 
服务 商 Archive Social ^" 与 得 克 萨 斯 .佛蒙特 E god Ate 
多 个 州 的 州 政府 及 辖区 内 各 市 政府 建立 了 合作 关系 。 
在 社交 媒体 存档 方面 ,Archive Social 主要 提供 两 种 服 
务 方式 ,其 一 是 利用 公司 既 有 的 信息 存储 设备 和 信息 
系统 对 政府 利用 政务 社交 媒体 产生 的 数据 内 容 进行 统 
一 存档 ,代替 政府 部 门 对 其 社交 媒体 数据 进行 长 期 保 
存 ,并 在 此 基础 上 提供 了 社交 媒体 数据 分 析 、 决 策 支 
持 ,知识 化 开发 等 增值 服务 ;其 二 是 帮助 政府 机 关 建 立 
政务 社交 媒体 存档 政策 ,通过 对 地 方 政 府 所 处 内 外 部 
环境 进行 分 析 , 结 合 风险 管理 与 评估 ,为 不 同 的 政府 机 
构 傈 定 合理 的 政务 社交 媒体 管理 政策 ,并 通过 案例 研 
完 的 形式 向 政府 机 构 作 一 反馈 。 澳 大 利 亚 的 Brolly 
是 回国 内 首 个 与 澳大利亚 政府 建立 合作 关系 的 社交 媒 
优 得 档 服务 商 , 主 要 面向 政府 机 关 `、 企 业 等 组 织 提供 社 
次 媒体 存档 服务 。Brolly 拥有 独立 的 云 数据 处 理 中 心 ， 
能 哆 快速 实现 海量 数据 采集 ` 机 构 数据 间 的 关联 、 基 于 
验 时 签名 的 数据 真实 性 认证 等 活动 ,该 公司 在 存档 服 
天 局 面 也 有 着 明确 的 使 用 条 款 和 隐私 政策 。 

ON 上 两 种 模式 体现 了 发 达 国 家 政务 社交 媒体 存档 
实 跟 的 既 有 机 制 和 发 展 水 平 。 吉 整体 而 言 ,“ 三 主体 模 
起 呢 * 双 主体 模式 " 的 发 展 与 延续 ,第 三 方 机 构 的 介 
入 疯 参 与 能 够 推动 政务 社交 媒体 存档 的 发 展 并 提升 政 
务 社交 媒体 数据 管理 的 规范 性 ,这 种 多 方 合作 的 机 制 
体现 了 社交 媒体 存档 的 发 展 趋势 。 而 在 研究 方面 , 目 
前 学 者 对 政务 社交 媒体 存档 的 研究 还 不 够 全 面 ,政府 
并 非 政 务 社交 媒体 存档 涉及 的 唯一 主体 ,企业 、 社 会 组 
织 等 机 构 同 样 会 面临 政务 社交 媒体 存档 问题 ,这 一 类 
主体 的 社交 媒体 存档 策略 还 有 待 学 者 进一步 研究 。 
4.2.3 ”区 域 社交 媒体 信息 资源 存档 ”以 区 域 为 划分 
标准 ,能 够 使 不 同 地 区 保存 的 社交 媒体 信息 资源 各 具 
特色 充分 反映 各 地 自然 与 社会 风貌 。 这 一 模式 下 ,各 
地 的 公共 图 书馆 、 档 案 馆 是 区 域 社交 媒体 信息 资源 存 
档 的 核心 主体 ,这 类 实践 往往 以 各 国 的 Web Archive 项 
目 为 主导 ,将 社交 媒体 纳入 Web Archive 的 存档 对 象 。 
澳大利亚 国家 图 书馆 和 澳洲 九 所 高 校 共 同 承担 运营 的 
Web Archive 项 目 PANDORA * 以 主题 事件 为 单位 对 
其 国内 的 社交 媒体 内 容 进 行 了 存档 ,存档 范围 涉及 Fa- 
cebook „Twitter 和 YouTube 等 多 个 平台 ,主要 由 澳 大 利 
亚 国 家 图 书馆 负责 保存 。PANDORA 在 社交 媒体 存档 


时 采取 了 保存 社交 媒体 网 页 的 形式 ,每 一 主题 都 由 多 
个 经 存档 的 社交 媒体 网 页 构成 ,以 此 与 PANDORA 传 
统 网 络 存档 模式 保持 一 致 ,用 户 可 以 通过 事件 主题 、 关 
键 词 . 字 顺 等 多 种 方式 在 其 官网 中 直接 检索 相关 的 社 
交 媒 体 信息 。 爱 尔 兰 皇家 科学 院 与 爱尔兰 国家 图 书馆 
合作 ,在 2014 年 建立 起 了 爱尔兰 社交 媒体 仓储 (Social 
,主要 对 全 国 范围 内 具有 长 期 
保存 价值 的 Twitter 内 容 进行 存档 ,其 后 将 逐步 考虑 更 
多 的 社交 媒体 平台 。 爱 尔 兰 社交 媒体 仓储 的 存档 流程 
EUKIEN. 事件 定义 .社交 媒体 采集 与 过 滤 、 
事件 与 推 文 的 标注 以 事件 为 单位 进行 长 期 保存 。“ 事 
件 ” 概 念 在 该 项 目 中 具有 重要 意义 , 它 是 社交 媒体 信息 
组 织 的 基本 单位 ,也 是 社交 媒体 分 类 的 标准 ,事件 可 以 

通过 众 包 形式 由 用 户 输入 关键 词 .定义 标签 等 方式 创 
建 , 随 后 系统 会 对 事件 主题 及 内 容 进 行 查 重 与 反馈 ,并 
根据 标注 内 容 建 立 数据 关联 、 剔 除非 法 与 元 余数 据 。 

以 区 域 层 次 为 基础 的 存档 形式 有 助 于 全 面 地 构建 
社会 记忆 ,是 社交 媒体 存档 实践 发 展 最 具 增 长 潜力 的 
形式 之 一 。 这 种 形式 往往 依托 既 有 的 网 络 存档 项 目 ， 
有 地 方 图 书馆 等 信息 服务 机 构 全 权 负 责 , 具 有 一 定 的 
稳定 性 与 可 持续 性 。 值 得 关注 的 是 ,区 域 社交 媒体 信 
息 资 源 存档 在 存档 对 象 与 内 容 上 可 能 会 与 政务 机 关 、 
社会 组 织 的 社交 媒体 存档 产生 重复 ,这 就 要 求 地 方 的 
图 书馆 档案 馆 等 机 构 应 对 区 域内 的 社交 媒体 存档 工 
作 进 行 统筹 规划 与 安排 ,提升 社交 媒体 存档 的 工作 效 
率 ,避免 相关 数字 化 平台 重复 建设 .存档 主体 重复 工作 
造成 的 资源 浪费 。 
4.3 数字 取证 

社交 媒体 存档 对 司法 取证 的 价值 主要 表现 为 对 电 
子 证 据 的 背景 信息 及 元 数据 的 全 面 记录 。 加 拿 大 于 
1998 年 颁布 的 《统一 电子 证 据 法 》( Uniform Electronic 
Evidence Act) 中 提 到 ,对 电子 证 据 的 识别 性 信息 以 及 
相关 的 变迁 情况 进行 完整 记录 与 存档 是 保障 电子 证 据 
真实 性 的 必要 活动 ”。 在 这 一 方面 ,以 信息 的 采集 和 
保存 为 核心 的 社交 媒体 存档 技术 能 够 为 司法 活动 中 的 
取证 环节 提供 支持 。 

M. Huber 和 M. Mulazzani ? [jj HR Facebook 平台 
提供 的 Neoprint ,开发 了 一 种 名 为 “Social Snapshot" If 
在 线 社交 媒体 用 户 快 照 工具 ,该 程序 主要 包括 客户 端 、 
自动 Web 浏览 器 .第 三 方 社 交 媒 体 快 照 程 序 、 网 络 嗅 
Tias .数字 图 像 取 证 和 数据 分 析 六 个 模块 , 旨 在 通过 多 
线程 环境 下 的 社交 媒体 数据 疏 取 与 分 析 形 成 以 图 像 为 
核心 的 数字 证 据 。 在 数字 图 像 采 集 之 外 , Social Snap- 
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shot 能 够 结合 候 虫 工具 对 在 线 社交 媒体 用 户 的 四、 好 
友 列 表 等 特定 背景 信息 及 其 他 隐藏 信息 进行 存档 ,将 
特定 用 户 行为 生成 时 间 戳 (timestamp ) 并 以 时 间 线 
(timeline) 的 形式 与 图 像 结 合 保存 ,经 过 存档 打包 后 作 
为 完整 的 电子 证 据 。 

J. Bushey” 基于 InterPARES 项 目的 研究 成 果 , 讨 
论 了 社交 媒体 环境 下 用 户 生成 内 容 (UGC) 尤 其 是 图 像 
和 视频 存档 的 完整 性 和 可 信 性 问题 ,认为 社交 媒体 信 
息 成 为 长 期 可 信 数 字 证 据 的 前 提 是 解决 以 下 问题 : 社 
交 媒 体 环 境 下 用 于 图 像 存 档 的 设备 必须 支持 EXIF 格 
式 (Exchangeable Image File) 要 求 且 其 时 设备 应 无 异 
dé ;存档 主体 应 参照 IPTC 核心 及 扩展 元 数据 集 (IPTC 
Core & Extensions metadata ) 以 保证 所 存档 的 视频 图 像 
元 数据 完整 性 等 。 存 档 主体 应 及 时 与 数字 信息 保存 机 
构 : 各 括 图 书馆 、 档 案 馆 与 可 信 第 三 方 ) 联系 ,使 存档 
后 的 图 像 视频 处 于 更 安全 ,专业 的 保管 环境 。 
LO 目前 ,基于 数字 取证 的 社交 媒体 存档 技术 形成 了 
以 筷 虫 技术 、 图 像 与 自然 语言 处 理 技术 和 加 密 技术 为 
榜 心 的 技术 体系 。 相 比 科研 数据 保存 和 网 络 信息 资源 
保佑 导向 ,数字 取证 导向 更 加 注重 社交 媒体 信息 的 真 
实 姓 和 可 信 性 ,需要 网 络 环境 下 的 动态 信息 转换 为 回 
优 罗 电子 证 据 。 当 前 该 领域 的 相关 研究 侧重 于 技术 环 
境 的 搭建 与 测试 ,对 社交 媒体 环境 下 数字 取证 政策 与 
标准 的 研究 还 比较 缺乏 ,需要 对 既 有 的 数字 取证 法 案 、 
标 浙 与 技术 体系 进行 进一步 更 新 。 
它 在 以 上 三 种 社交 媒体 存档 的 基本 导向 之 中 ,网 络 
信息 资源 保存 导向 尤其 是 政务 社交 媒体 存档 目前 在 实 
践 giK 平 与 研究 热度 方面 均 领先 于 其 他 类 型 的 实践 ,是 
目前 国内 外 学 者 在 社交 媒体 存档 研究 领域 中 最 为 关注 
的 子 课题 ,产生 了 大 量 供 学 者 研究 分 析 的 实践 案例 。 
社交 媒体 环境 下 的 科研 数据 保存 与 数字 取证 还 需要 在 
研究 与 实践 中 与 科学 数据 管理 .电子 文件 管理 等 研究 
领域 相 结 合 , 借助 既 有 研究 领域 的 成 熟 方 法 与 体系 来 
完善 科研 数据 保存 .数字 取证 领域 的 社交 媒体 存档 策 
略 与 技术 。 


5 ”社交 媒体 存档 的 政策 与 指南 

目前 国内 外 与 社交 媒体 存档 政策 及 指南 相关 的 研 
究 主 要 包括 两 种 类 型 ,其 一 是 对 相关 政策 进行 介绍 .并 
在 此 基础 上 对 国内 的 社交 媒体 存档 提出 建议 的 “ 引 
介 一 启示 "型 研究 ,其 二 是 结合 既 有 的 社交 媒体 存档 实 
践 ,对 社交 媒体 存档 政策 的 核心 要 素 进 行 探讨 的 “深度 
分 析 一 建构 "型 研究 。 
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5.1 “ 引 介 一 启示 ”型 研究 

“ 引 介 一 启示 ”型 研究 以 一 系列 社交 媒体 环境 下 
政府 信息 资源 管理 的 办 法 与 指南 为 基础 。 最 具 代 表 性 
的 政策 如 美国 国家 档案 与 文件 署 发 布 的 Best Practices 
for the Capture of Social Media Records ^"! ,英国 国家 档案 
馆 发 布 的 Operational Selection Policy ^ 以 及 澳大利亚 
司 家 图 书馆 发 布 的 Social Media Policy ^ 55 , xx Fe c fr 
中 涉及 社交 媒体 存档 部 分 的 内 容 大 致 相似 ,主要 包括 
政务 社交 媒体 的 保存 目的 与 价值 ,判断 与 识别 方法 、 捕 
获 与 保存 策略 等 内 容 。 

C. Doran* X36 到 各 级 政府 制定 的 社交 媒体 管理 
与 保存 政策 的 内 容 及 特征 进行 了 归纳 总 结 ,将 相关 政 
策 依 更 新 频率 和 详细 程度 两 个 指标 划分 至 四 个 象限 ， 
如 第 一 象限 代表 “内容 详 尽 且 更 新 频率 高 的 政策 ”, 第 
三 象限 表示 “内容 粗 略 且 更 新 频率 低 的 政策 ”。C. Do- 
ran 认为 落 在 某 一 象限 并 不 反映 政策 本 身 的 优 劣 ,粗略 
的 政策 也 有 其 宏观 层面 的 作用 ,执行 机 构 在 面 对 粗 略 
政策 时 需要 进一步 制定 具体 化 的 附加 政策 ,而 第 一 象 
限 的 政策 则 需要 不 断 更 新 以 持续 指导 相关 实践 。 

王 焕 汪 以 存档 主体 和 政策 主题 为 主线 ,对 英国 、 
美国 和 澳大利亚 的 政务 社交 媒体 存档 政策 进行 了 较为 
详细 的 解读 ,认为 数字 连续 性 (Digital Continuity ) 原则 
是 国外 政务 媒体 存档 依据 的 基本 原则 ,随后 着 重 对 英 
美 澳 三 国政 务 社交 媒体 存档 的 范围 规则 、 捕 获 技术 与 
利用 方式 等 内 容 进行 介绍 ,并 从 宏观 层面 探讨 了 政务 
社交 媒体 存档 的 所 有 权 、 动 力 问 题 以 及 既 有 政策 之 间 
的 兼容 问题 ,是 国内 较 早 关注 国外 社交 媒体 存档 的 研 
守之 

目前 ,国内 外 的 “ 引 介 一 启示 ”型 研究 对 网 络 上 可 
见 的 政务 社交 媒体 存档 政策 进行 了 比较 完整 ,准确 的 
解读 ,这 一 方面 的 研究 就 研究 内 容 与 文章 数量 而 言 也 
近 于 饱和 ,以 上 两 位 学 者 的 研究 在 内 容 与 形式 上 具有 
一 定 代 表 性 。 然 而 在 官方 政策 之 外 ,部 分 第 三 方 机 构 
如 Archive Social ,Smarsh 等 也 针对 企 事 业 单 位 、 非 政府 
组 织 等 机 构 的 需求 制定 了 相应 的 存档 政策 ,这 些 政策 
的 规范 性 与 合理 性 仍 有 待 探讨 ,这 也 是 目前 社交 媒体 
存档 政策 研究 的 可 见 增 长 点 。 
5.2 “深度 分 析 一 建构 ”型 研究 

社交 媒体 存档 政策 的 “深度 分 析 一 建构 ”型 研究 
往往 建立 在 既 有 政策 基础 上 , 旨 在 探讨 既 有 政策 的 不 
足 之 处 以 及 新 政策 的 构建 方式 。C. Marshall 和 下. 
Shipman ”基于 用 户 意愿 和 观点 调查 ,对 社交 媒体 存档 
的 制度 问题 进行 了 探讨 ,着 重 分 析 了 其 中 涉及 的 存档 


Chinay iw 会 人 作 甘 日 干 
ChinaXiv 合 作 期 刊 


RAR, BRA. 国内 外 社交 媒体 存档 研究 与 实践 述评 [了 . 图 书 情报 工作 ,2019 ,63(4) :122 - 134. 


权限 、 内 容 范 围 ,技术 保证 及 法 律 问题 ,指出 了 社交 媒 
体 存档 政策 与 制度 构建 中 存在 的 障碍 ,认为 后 续 的 社 
交 媒体 存档 政策 应 在 内 容 价值 .技术 手段 ,法律 依据 等 
方面 进行 更 细致 的 规定 与 说 明 。 

高 晨 翔 和 黄 新 荣 '” 对 国内 社交 媒体 存档 政策 进 
行 了 讨论 与 构建 ,包括 社交 媒体 存档 政策 的 依据 与 保 
障 ,平台 与 主体 ,条 件 与 范围 ,存档 技术 与 组 织 形式 等 
内 容 , 作 者 以 国内 的 微 博 和 微 信 平台 为 基础 ,认为 存档 
主体 主要 包括 政府 机 构 .综合 性 档案 馆 和 公共 图 书馆 ， 
主体 应 按 其 职能 定期 对 具有 保存 价值 的 社交 媒体 信息 
进行 统一 保存 ,并 基于 OAIS 框架 提出 了 社交 媒体 信息 
长 期 保存 的 简要 框架 。 泉 魏 峙 基于 文件 管理 视 域 ， 
分 析 了 国内 政府 社交 媒体 存档 的 法 律 依据 和 管理 准 
则 5 在 此 基础 上 构建 了 包括 政府 部 门 .档案 部 门 和 社交 
媒体 服 务 商 在 内 的 多 元 互动 的 社交 媒体 文件 管理 主体 
废 局 机 制 , 认 为 以 上 三 个 主体 应 分 别 起 到 政策 制定 与 
蚂 竹 管控 .标准 制定 与 业务 指导 数据 存档 与 技术 支持 
仿 甬 ,同时 建立 “存档 一 管理 一 利用 ”三 环节 联动 的 政 
务 社交 媒体 管理 流程 ,在 保证 政务 社交 媒体 数据 安全 

融 提 下 便利 用 户 的 查询 利用 。 

CJ 国外 的 政策 建构 型 研究 以 既 有 的 社交 媒体 管理 与 
存 简 实践 为 基础 ,对 问题 与 现状 产生 的 原因 进行 了 深 
度 控 抓 ,指出 了 未 来 政策 制定 与 修正 的 方向 。 而 国内 
学 者 的 研究 在 体系 与 构想 方面 均 比较 完整 ,不 足 之 处 


人 种 半 缺 乏 必要 的 实践 基础 ,因此 这 种 政策 的 建构 与 论 
证 移 合 理性 方面 还 有 待 商 榨 和 验证 。 在 方法 层面, 国 
内 群 究 应 重视 相关 领域 的 实证 调查 ,在 得 到 具体 .规范 
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6 社交 媒体 存档 的 问题 与 障碍 
6.1 国外 社交 媒体 存档 中 的 争议 与 问题 


6.1.1 隐私 争议 大 数据 时 代 的 数据 分 析 者 能 够 从 
上 只言片语 中 分 析出 社交 媒体 信息 发 布 者 的 兴趣 爱好 、 
情感 倾向 政治 立场 等 隐私 性 内 容 , 进 而 建立 起 特定 信 
息 与 个 人 身份 之 间 的 关联 。C. Marshall 和 下 ，Shipm- 
an 针对 Facebook 的 制度 化 存档 问题 进行 了 用 户 调 
查 ,结果 在 参与 调查 的 244 人 中 ,有 128 人 认为 无 论 如 
何 都 不 应 该 使 Facebook 存档 制度 化 , 占 总 人 数 的 
52% ,而 回答 “应 该 存档 "或 “应 该 有 条 件 地 存档 ”的 人 
数 相 加 也 仅 有 101 人 。 反 对 Facebook 存档 的 用 户 普遍 
担忧 的 问题 有 :大 规模 的 Facebook 存档 让 用 户 丢 失 了 
数据 控制 权 ; 被 某 些 机 构 或 个 人 恶意 利用 (如 犯罪 前 科 
或 性 取向 被 公开 披露 ) 等 。 而 对 于 Facebook 存档 持 支 


持 或 部 分 支持 态度 的 用 户 则 认为 :社交 媒体 平台 上 的 
隐私 泄露 问题 往往 微不足道 ;可 以 接受 存档 主体 有 选 
择 地 、 有 范围 地 进行 存档 等 。 

依据 学 者 的 调查 分 析 能 够 看 出 ,社交 媒体 存档 需 
要 在 社会 价值 .个 人 隐私 与 信息 人 格 塑造 之 间 找 到 平 
衡 点 。 需 要 注意 ,存档 中 的 隐私 争议 不 仅 涉及 个 人 信 
息 汇 露 问 题 ,更 为 重要 的 是 存档 后 的 信息 表现 与 内 容 
反映 ,这 些 内 容 的 建构 特性 可 能 会 使 用 户 在 现实 与 虚 
拟 生 活 中 遭遇 不 必要 的 人 格 固化 ,从 而 影响 到 个 人 的 
发 展 。 
6.1.2. 权 属 问题 “在 社交 媒体 平台 中 ,用 户 是 社交 媒 
体内 容 的 发 布 者 ,部 有 社交 媒体 内 容 的 著作 权 ,社交 媒 
体 服务 商 对 用 户 生成 内 容 具 有 实际 控制 权 。 当 多 个 用 
户 围绕 某 一 主题 或 事件 发 布 包括 原创 信息 及 评论 在 内 
的 大 量 内 容 , 形 成 复杂 的 交互 关系 ,这 种 情境 下 权 属 问 
题 的 界定 颇 有 难度 O 。 

C. Marshall 和 下 . Shipman *' 利用 7 级 Likert 量 表 
对 Facebook , Twitter 以 及 Skype 用 户 的 社交 媒体 信息 权 
利 意识 进行 了 测评 ,发 现 三 个 平台 用 户 均 认为 对 自己 
发 布 的 社交 媒体 信息 应 具有 强大 的 控制 权 , 担 忧 制 度 
化 的 社交 媒体 存档 会 侵犯 个 人 数据 权利 ,尤其 是 “能 否 
将 用 户 数据 存档 后 销售 给 亚马逊 ?”“ 能 和 否 对 存档 数据 
进行 分 析 以 便 广告 推送 ?” 等 几 个 问题 都 招致 了 被 调查 
者 的 强烈 反对 ,而 对 “存档 公共 事件 ”*"“ 经 允许 后 获得 
个 人 公开 数据 保存 权利 "等 问题 的 态度 则 比较 温和 。 

REER fn ^^ 分 析 了 社交 媒体 科研 数据 存 
档 与 应 用 中 可 能 存在 的 侵权 问题 。 首 先 ,科学 研究 活 
动 中 的 理论 验证 、 元 分 析 等 研究 方法 可 能 需要 获取 与 
既 有 科研 成 果 同 样 的 社交 媒体 数据 集 , 而 Facebook 和 
Twitter 的 使 用 条 款 均 限制 了 已 存档 数据 集 的 重复 使 
用 ,未 经 授权 的 使 用 即 为 侵权 行为 。 其 次 , 当 某 一 社交 
媒体 数据 集中 包含 受 著作 权 保 护 的 内 容 ( 如 图 片 视频 
等 ) 时 ,那么 基于 该 数据 集 的 科研 成 果 知 内 能 了 这 些 内 
容 则 同样 构成 侵权 。 尽 管 存在 “通过 相同 ID 重新 存档 
数据 "以 及 "图 片 分 析 仅 限于 元 数据 层面 且 采 用 定量 
方法 "等 折 中 办 法 ,但 大 大 影响 了 科学 研究 的 效率 和 准 
确 性 。 

社交 媒体 的 存档 主体 往往 需要 采取 复杂 的 折 囊 方 
式 才 能 避免 侵权 陷阱 ,因此 许多 国家 和 机 构 尚 未 大 规 
模 开展 社交 媒体 存档 工作 。 面 对 这 一 问题 ,大 英 图 书 
馆 (The British Library) 以 本 国 的 非 印 本 文献 法 定 呈 缴 
制度 ( Non -print Legal Deposit ) 为 保障 ,有 选择 地 存档 与 
某 一 重要 事件 或 主体 相关 的 社交 媒体 内 容 , 避 免 了 其 
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中 存在 的 著作 权 纠 纷 “ ,值得 其 他 机 构 借鉴 。 对 于 科 
研 导 向 的 社交 媒体 存档 ,其 著作 权 问 题 尚 需 各 国立 法 
机 构 .科研 机 构 及 相关 利益 主体 相互 协作 以 提出 合适 


的 解决 方案 。 
6.1.3 ”技术 限制 相 比 于 隐私 和 权 属 问题 ,技术 限制 


表现 出 的 问题 更 为 客观 ,是 社交 媒体 存档 工作 中 最 直 
接 的 陪 碍 。F.，McCown 和 M. L. Nelson ^" ZEE Zz Fa- 
cebook 的 存档 技术 时 认为 ,传统 的 Web Archive 技术 方 
法 在 面临 Facebook 存档 问题 时 往往 以 两 种 形式 出 
现 一 一 基于 比特 的 存档 和 基于 内 容 的 存档 。 前 者 是 网 
页 存档 中 最 常用 的 方式 , 即 以 网 页 为 单位 ,将 某 一 Fa- 
cebook 页 面 的 HTML 文件 ,样式 表 、JavaScript 编写 的 脚 
本 内 容 以 及 Flash 文件 等 统一 存档 ,以 便 在 Web 浏览 
器 中 查看 ;而 后 者 则 是 将 Facebook 上 的 图 像 文本 和 视 
频 屋 取 至 本 地 分 别 保存 ,然而 这 两 种 存档 方式 可 能 千 
神 交 媒体 的 原 格 式 丢失 和 数据 交互 性 缺失 。 

NS: D. Thomson 和 W. Kilbride/9? jn]J& pj Y tH az llt 
TTE BUE DEVE BC IRR, NAERU: 

入 _(1) 访 问 限 制 。 与 普通 网 页 不 同 ,Twitter 与 Face- 
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2) 采 集 与 捕获 限制 。 科 研 活动 中 的 社交 媒体 存 
TEC SEXE Y API 进行 批量 的 数据 采集 ,但 各 社交 
媒体 平台 对 存档 主体 的 数据 量 请 求 和 捕获 速率 均 有 限 
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据 苞 须 依 用 户 需求 进行 分 析 与 挖掘 才 能 发 挥 其 价值 


— 


这 允 用 于 数据 加 工 的 软 硬 件 平台 均 有 一 定 要 求 ;而 且 
加 工 后 的 利用 方式 也 受 社交 媒体 服务 商 的 协议 限制 ， 
Facebook 和 Twitter 规定 用 户 不 能 随意 “ 出售、 出 租 、 重 
新 发 布 垄断 "社交 媒体 数据 。 

通过 以 上 学 者 的 分 析 论 述 不 难 发 现 ,社交 媒体 存 
档 的 技术 障碍 通常 表现 在 技术 层面 ,但 并 非 由 单纯 的 
技术 原因 引起 。 如 今 , 云 计算 .语义 网 和 人 工 智能 技术 


前 文 提 到 的 国外 社交 媒体 存档 的 争议 与 问题 也 是 制约 
我 国 社交 媒体 存档 发 展 的 重要 原因 ,此 外 ,我 国学 者 还 
总 结 了 一 些 影响 我 国 社交 媒体 存档 发 展 的 个 性 化 因 
素 , 具 体 表 现 如 下 。 

6.2.1 存档 主体 的 意识 问题 以 当前 社交 媒体 存档 
中 的 主流 模式 一 一 政务 社交 媒体 存档 为 例 ,存档 主体 
意识 的 缺失 对 社交 媒体 存档 工作 的 开展 具有 明显 影 
响 。 目 前 我 国 从 中 央 到 地 方 各 级 各 类 国家 机 关 都 开设 
了 各 自 的 官方 微 博 \ 微 信 , 但 负责 运营 的 工作 人 员 以 兼 
职 居多 ,往往 不 具备 社交 媒体 信息 管理 意识 ,也 普遍 缺 
乏 专 业 的 社交 媒体 存档 与 管理 能 力 “ 。 笔 者 曾 对 我 
东部 地 区 某国 家 机 关 政 务 微 博 、 微 信 平 台 的 存档 情 
况 进行 了 网 络 调查 ,负责 运营 的 工作 人 员 均 认为 微 博 、 
微 信 和 是 开放 平台 ,过 往 信 息 的 检索 和 查询 较为 容易 ,无 
需 专门 存档 。 因 此 ,这 一 认识 环境 下 的 社交 媒体 存档 
工作 自然 难以 开展 。 

6.2.2 政策 保障 与 业务 指导 缺 位 通过 对 国外 社交 
媒体 存档 实践 的 总 结 与 分 析 ,不 难 发 现 政策 法 规 的 保 
障 和 专业 机 构 的 指导 是 社交 媒体 存档 实践 的 必要 基 
础 ,而 我 国 目 前 在 以 上 两 方面 均 存在 不 同 程度 的 缺 位 。 
就 政策 法 规 而 言 ,我国 目前 在 微观 层面 缺乏 具体 的 社 
交 媒 体 管理 .保存 政策 ,宏观 层面 的 网 络 信息 法 律 体系 
也 尚未 建立 ,无 论 是 政务 机 关 还 是 其 他 主体 发 布 的 社 
交 媒 体 ,对 其 进行 存档 都 缺乏 必要 依据 ,这 也 导致 社交 
媒体 存档 缺乏 “财政 拨款 ”这 一 重要 的 经 费 来 源 ” 。 
另 一 方面 ,前文 提 到 的 重要 存档 主体 一 一 图 书馆 、 档 案 
馆 目 前 均 未 将 社交 媒体 纳入 长 期 保存 的 对 象 范畴 ,也 
没有 设置 专门 机 构 或 安排 人 员 对 社交 媒体 存档 工作 进 
行业 务 指导 ,因此 无 论 政务 机 关 或 是 社会 组 织 ,在 社交 
媒体 存档 方面 均 面 临 无 从 着 手 的 问题 。 

6.2.3 ”社交 媒体 服务 商 的 限制 ”我 国 社交 媒体 服务 
商 制定 的 社交 媒体 信息 管理 方案 也 存在 一 定 问题 。 据 
学 者 调查 ,新 浪 微 博 、 腾 讯 微 信 等 社交 媒体 平台 公布 的 
填 息 服务 协议 与 隐私 政策 等 集中 存在 以 下 问题 '” : 主 


Bi 


F^] A IB JE , MER FEF BA JE — 2p 8I Be 45 .高 效 化 , 云 计 
算 带 来 的 信息 处 理 能 力 与 存储 能 力 以 及 基于 深度 学 习 
的 文本 、 图 像 处 理 技术 为 打破 社交 媒体 存档 的 技术 限 
制 提供 了 极 大 帮助 ,因此 单纯 的 技术 限制 是 暂时 的 。 
解决 服务 商 对 数据 的 管控 与 限制 问题 .用户 对 数据 泄 
露 与 隐私 风险 的 担忧 问题 能 够 从 更 深层 次 为 技术 问题 
的 解决 提供 思路 与 办 法 。 
6.2 我 国 社交 媒体 存档 发 展 的 制约 因素 

相 比 国外 ,我 国 的 社交 媒体 存档 实践 发 展 缓慢 。 
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要 强调 服务 商 对 信息 的 控制 权 ,信息 保存 的 期 限 .范围 
与 技术 方案 均 由 服务 平台 决定 ,社交 媒体 信息 的 发 布 
与 存档 主体 难以 掌握 这 些 内 容 ;缺乏 信息 管理 的 专业 
性 , 仅 从 用 户 角度 明确 用 户 的 信息 权利 与 义务 ,忽视 了 
政务 信息 等 专门 性 信息 保存 与 管理 的 专业 流程 ,也 未 
说 明 服 务 商 信息 管理 所 依据 的 行业 标准 与 法 规 等 。 这 
些 问 题 反 映 了 服务 商 在 社交 媒体 信息 的 保存 与 管理 方 
面 缺乏 专业 视角 ,也 为 专业 的 存档 主体 批量 获取 社交 
媒体 信息 设置 了 障碍 。 


China nc MEBHI 
CI naX v£ | 年 期 1 | 


74J 


RHR, BRA. 国内 外 社交 媒体 存档 研究 与 实践 述评 [了 .图书 情报 工作 ,2019,63(4) :122 - 134. 


7.1 研究 与 实践 的 基本 特征 
本 文 主要 分 “目的 与 主体 "“ 政 策 与 指南 ”“ 问 题 
与 障碍 "三 个 主题 对 国内 外 社交 媒体 存档 领域 的 研究 
与 实践 热点 进行 了 归纳 与 梳理 ,该 领域 的 研究 与 实践 
表现 出 以 下 几 个 特点 。 
7.1.1 依托 既 有 研究 成 果 与 环境 ,发 展 速度 较 快 社 
交 媒体 存档 领域 是 多 学 科 交 叉 的 热门 研究 领域 ,受到 
了 信息 管理 科学 .计算 机 科学 .社会 学 等 多 个 学 科学 者 
的 关注 。 在 社交 媒体 存档 研究 之 前 ,国内 外 在 Web Ar- 
chive 领域 已 经 积累 了 较为 丰富 的 理论 与 实践 成 果 ， 
Web Archive 的 研究 方法 与 技术 逐步 成 熟 , 这 为 社交 媒 
体 在 档 研究 营造 了 良好 的 环境 与 基础 。 
7.90. 实践 工作 是 重要 动力 ,与 学 术 研 究 相 互 影响 
竹 各 社交 媒体 存档 的 发 展 历程 不 难 发 现 ,实践 工作 是 
这 全 领域 研究 发 展 的 重要 推力 。 当 美国 国会 图 书馆 宣 
BEIT Twitter 存档 工作 ,英国 .美国 及 澳大利亚 图 书 
馆 瑟 档案 部 门 策动 政府 直属 机 关 进 行 社交 媒体 存档 
时 5 学 术 界 对 社交 媒体 存档 的 讨论 还 十 分 少见 。 发 达 
国 当 的 政府 与 图 书 档案 部 门 在 社交 媒体 存档 中 遇 到 的 
隐 移 .技术 . 权 属 等 各 种 问题 为 学 者 提供 了 良好 的 研究 
如 ,推动 了 该 领域 学 术 研 究 的 不 断 发 展 。 
7.8. 国内 与 国外 在 研究 与 实践 上 均 存 在 差距 H 
前 我 国 与 国外 在 社交 媒体 存档 的 研究 与 实践 上 均 存 
在 狼 大 差距 。 一 方面 , 相 比 国外 研究 ,我 国 在 研究 视角 
上 丘 较 单一 ,研究 内 容 上 也 主要 以 引 介 国外 社交 媒体 
存 倍 与 管理 政策 和 探讨 国内 社交 媒体 存档 策略 为 主 ， 
不 同学 者 的 研究 之 间 存 在 重复 性 ,而 采取 的 研究 方法 
也 以 思辨 性 论述 为 主 ,缺少 基于 数据 调查 与 分 析 的 实 
证 研究 。 另 一 方面 ,我 国 社交 媒体 存档 实践 也 进展 较 
慢 , 尚 未 形成 规模 化 的 社交 媒体 存档 行为 ,也 缺乏 必要 
的 政策 与 标准 支持 ,目前 还 没有 出 现 如 英美 澳 等 国政 
务 社交 媒体 存档 这 样 的 典型 案例 。 
7.2 ”对 国内 社交 媒体 存档 研究 与 实践 发 展 的 建议 
7.2.1 学 术 研 究 方 
(1) 注 重 研 究 类 型 与 范围 的 扩展 ,完善 研究 体系 。 
当前 ,国内 学 者 应 重视 研究 视野 与 范围 的 扩展 ,在 从 事 
政策 分 析 型 研究 之 外 ,还 应 重点 关注 国内 外 的 社交 媒 
体 存档 系统 与 技术 、 用 户 对 社交 媒体 存档 的 意愿 与 诉 
求 . 既 有 的 网 络 存档 技术 标准 在 社交 媒体 存档 中 的 应 
用 等 内 容 具 体 、 紧 扣 实践 的 热门 课题 ,从 而 在 该 领域 形 
成 比较 完善 的 研究 体系 ,这 对 于 我 国 社交 媒体 存档 实 


践 的 开展 也 有 神 益 。 

(2) 提升 研究 深度 ,避免 表面 研究 。 国 内 既 有 的 
社交 媒体 存档 研究 以 分 析 国外 既 有 政策 为 主 ,重视 对 
各 国政 策 内 容 的 列举 与 政策 背景 的 分 析 , 研 究 内 容 缺 
乏 新 意 与 深度 。 一 方面 ,国内 学 者 应 在 政策 内 容 与 背 
景 之 上 关注 国外 的 法 律 制 度 , 行 政体 制 与 社会 环境 特 
iE ,通过 对 比分 析 探 寻 国 内 社交 媒体 存档 实践 发 展 组 
慢 的 深层 次 原因 。 男 一 方面 ,国内 学 者 还 应 关注 国外 
学 者 在 相关 领域 内 的 研究 取向 、 研 究 思路 与 研究 方法 ， 
注重 对 研究 对 象 特征 与 属性 的 深层 挖掘 。 

7.2.2 存档 实践 方 

(1) 政 策 与 标准 先行 ,确立 规范 的 存档 工作 体系 。 
纵 观 美国 ,英国 的 社交 媒体 存档 实践 ,存档 政策 与 标准 
的 制定 是 存档 工作 持续 化 、 规 模 化 开展 的 必要 条 件 。 
我 国 的 国家 图 书馆 、 国 家 档案 局 等 单位 应 在 深入 调研 
的 基础 上 先行 提出 国内 的 社交 媒体 存档 方案 ,随后 进 
一 步 研 究 既 有 的 信息 管理 与 长 期 保存 标准 如 何 应 用 于 
社交 媒体 信息 存档 ,并 指导 试点 单位 逐步 开展 社交 媒 
体 存档 工作 ,以 此 为 机 关 单 位 社会 组 织 的 社交 媒体 存 
档 实践 建立 基础 与 依据 。 

(2) 建 立 多 主体 协作 下 的 社交 媒体 存档 机 制 。 多 
主体 协作 机 制 是 国外 社交 媒体 存档 发 展 的 基本 趋势 ， 
建立 多 主体 协作 机 制 对 于 理 顺 各 方 关系 、 兼 顾 各 方 利 
益 以 保证 社交 媒体 存档 工作 顺利 开展 具有 重要 意义 。 
其 中 图 书馆 档案 馆 与 国家 机 关 的 协作 是 基本 形式 ,此 
外 ,第 三 方 商业 机 构 在 存档 技术 与 专业 性 方面 具有 优 
势 , 也 可 作为 政务 社交 媒体 存档 的 解决 方案 ,以 上 主体 
同时 还 应 与 社交 媒体 服务 商 建立 合作 协议 ,以 便 在 数 
据 的 获取 与 管理 方面 取得 相关 权利 ,协助 服务 商 完善 
其 平台 信息 管理 政策 ,保障 这 一 机 制 的 正常 运转 。 

(3) 注 重 存 档 实践 开展 的 阶段 性 与 层次 性 。 社 交 
媒体 存档 工作 是 一 项 长 期 性 、 持 续 性 的 工作 ,其 规划 与 
发 展 应 避免 此 前 各 地 在 建设 数字 图 书馆 与 数字 档案 馆 
时 产生 的 “追赶 潮流 ”现象 ,从 而 造成 资源 浪费 、 项 目 
可 持续 性 差 等 问题 。 我 国 在 开展 社交 媒体 存档 式 应 循 
序 渐进 ,各 地 应 根据 机 构 意 愿 选 择 试点 进行 试验 性 的 
存档 工作 ,以 便 对 项 目的 价值 效益 、 问 题 等 进行 评估 
后 调整 既定 策略 ,进而 有 层次 地 建立 社交 媒体 存档 实 
践 体系 。 
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Review on Research and Practice of Social Media Archiving 
Huang Xinrong Gao Chenxiang 
School of Public Management, Northwest University, Xi’ an 710127 
Abstract; [ Purpose/significance | Social media archiving has become an important content in web archive field. By 
combing and summarizing the related literature, this paper aims to provide reference for future related research in this 
field. [ Method/process] Based on the multi -disciplinary perspective, we obtain the literature distribution features and 
summarized the theoretical basis of social media archive, by the means of bibliometrics analysis and content analysis. 
Then, we summarized the theory and practice of social media archiving as three research topics at the macro level, inclu- 
ding "purpose and subject" , "policy and guide" and "problems and obstacles". [ Result/conclusion | This paper puts 
forward some characteristics for the research of social media archiving, including rapid development, closely related to 
practice and unbalanced regional development. Ultimately, this paper points out that scholars and practitioners should pay 
attention to the change of research object, construction of archiving standards and the cooperation among multiple sub- 
jets We also give some brief suggestions to the practice and research of social media archiving in China. 
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